Journal of Systems Engineering and Electronics ›› 2011, Vol. 33 ›› Issue (1): 196-0201.doi: 10.3969/j.issn.1001 506X.2011.01.40
翟云1,2,杨炳儒1,曲武1,隋海峰1
ZHAI Yun1,2,YANG Bing-ru1,QU Wu1,SUI Hai-feng1
摘要:
针对非平衡数据分类问题,提出了一种基于差异采样率的重采样算法(differentiated sampling rate algorithm, DSRA),基于DSRA设计了一种新的集成分类器(SVM-Ripper ensemble classifier, SREC)。SREC采用独特的分类器选择策略、分类器集成策略、分类决策方案,可获得较高的分类精度。同时,利用SREC对影响非平衡数据分类的关键问题进行了研究。结果表明,非平衡数据分类问题本质上是由正负样本类间非平衡、类内非平衡、样本规模以及样本非平衡度等诸多因素引起的,只有综合考虑这些因素才能更好地解决非平衡数据分类问题。